ডেটার বৈচিত্র্য, বা ডেটা সেটের মধ্যে পার্থক্য এবং বিচ্যুতি, পরিসংখ্যানিক বিশ্লেষণের গুরুত্বপূর্ণ অংশ। এটি সাধারণত Range, Quartile Deviation (QD), এবং Mean Deviation (MD) এর মাধ্যমে পরিমাপ করা হয়। এই পরিসংখ্যানিক পরিমাপগুলো ডেটার বৈচিত্র্য বা স্ক্যাটার সম্পর্কে ধারণা দেয়, যা ডেটার বিস্তার এবং কেন্দ্রীকরণ বুঝতে সহায়ক।
১. Range (রেঞ্জ)
Range হল একটি ডেটা সেটের সর্বোচ্চ এবং সর্বনিম্ন মানের মধ্যে পার্থক্য। এটি একটি সরল এবং মৌলিক পরিসংখ্যানিক পরিমাপ যা ডেটার বিস্তার বা ছড়িয়ে পড়া বোঝাতে ব্যবহৃত হয়।
রেঞ্জ হিসাব করার সূত্র:
ব্যবহার:
- Range ডেটার বিস্তার বা ভ্যারিয়েশন বুঝতে সহায়ক। এটি সাধারণত প্রথম দৃষ্টিতে ডেটার প্রকৃতি বোঝানোর জন্য ব্যবহার করা হয়।
- যেহেতু এটি খুব সহজে গণনা করা যায়, এটি দ্রুত ডেটার মূল বৈশিষ্ট্য তুলে ধরে।
উদাহরণ:
ধরা যাক, একটি পরীক্ষায় ছাত্রদের স্কোরগুলো হল: ৪৫, ৬৮, ৭৯, ৯২, ৫৭
- সর্বোচ্চ স্কোর = ৯২
- সর্বনিম্ন স্কোর = ৪৫
- Range = ৯২ - ৪৫ = ৪৭
২. Quartile Deviation (QD) বা Interquartile Range (IQR)
Quartile Deviation (QD), যা Interquartile Range (IQR) নামেও পরিচিত, হল ডেটার মধ্যস্থ ৫০% (Q1 থেকে Q3) মধ্যে পার্থক্য। এটি ডেটার কেন্দ্রীকরণের পার্থক্য বা বিচ্যুতি বুঝতে সাহায্য করে এবং আউটলায়ার বা বিশাল পরিবর্তনগুলোর প্রভাব কমায়।
Quartile Deviation হিসাব করার সূত্র:
এখানে,
- Q1 হল প্রথম কোয়ারটাইল (২৫% পয়েন্ট)
- Q3 হল তৃতীয় কোয়ারটাইল (৭৫% পয়েন্ট)
ব্যবহার:
- QD ডেটার মধ্যে কেন্দ্রীকরণ বা ছড়িয়ে পড়া বোঝাতে ব্যবহৃত হয়, বিশেষত যখন আউটলায়ার বা বাইরের ডেটা পয়েন্টগুলি রয়েছে।
- এটি Range এর তুলনায় বেশি নির্ভুল পরিমাপ, কারণ এটি আউটলায়ারের প্রভাব কমায়।
উদাহরণ:
ধরা যাক, ডেটাসেট: ৫, ৭, ১২, ১৫, ১৮, ২১, ২৫, ২৮, ৩২
- Q1 (প্রথম কোয়ারটাইল) = ১০.৫
- Q3 (তৃতীয় কোয়ারটাইল) = ২৪
- Quartile Deviation (QD) = (২৪ - ১০.৫) / ২ = ৬.৭৫
৩. Mean Deviation (MD)
Mean Deviation (MD) হল ডেটার প্রতিটি মান এবং গড়ের (Mean) মধ্যে পার্থক্যের গড় মান। এটি ডেটার থেকে গড়ের বিচ্যুতি বা ছড়িয়ে পড়া মাপতে ব্যবহৃত হয়।
Mean Deviation হিসাব করার সূত্র:
এখানে,
- হলো ডেটার প্রতিটি মান
- হলো গড় মান
- হলো ডেটার মোট সংখ্যা
ব্যবহার:
- MD ডেটার মধ্যে কতটা বিচ্যুতি বা ভিন্নতা আছে তা বোঝাতে ব্যবহৃত হয়।
- এটি Range এবং Quartile Deviation এর তুলনায় একটি গড় বিচ্যুতি দেখায়, তবে এটি প্রতিটি মানের বিচ্যুতি বিবেচনা করে।
উদাহরণ:
ধরা যাক, ডেটাসেট: ৩, ৫, ৭, ৯, ১১
- গড় মান = (৩ + ৫ + ৭ + ৯ + ১১) / ৫ = ৭
- MD = = = 2.4
Range, Quartile Deviation এবং Mean Deviation তুলনা:
| বৈশিষ্ট্য | Range | Quartile Deviation (QD) | Mean Deviation (MD) |
|---|---|---|---|
| ডেটা পদ্ধতি | সর্বোচ্চ এবং সর্বনিম্ন মানের পার্থক্য | প্রথম এবং তৃতীয় কোয়ারটাইলের মধ্যবর্তী পার্থক্য | গড় এবং ডেটার প্রতিটি মানের মধ্যে পার্থক্য |
| গণনা | খুব সহজ এবং সরল | Q1 এবং Q3 থেকে গণনা | প্রতিটি মান এবং গড়ের মধ্যে বিচ্যুতি গণনা |
| প্রভাবিত হয় | আউটলায়ার দ্বারা | আউটলায়ার কম প্রভাব ফেলে | আউটলায়ার দ্বারা কিছুটা প্রভাবিত হয় |
| ব্যবহার | ডেটার বিস্তার বুঝতে | ডেটার কেন্দ্রীকরণের বিচ্যুতি বোঝাতে | ডেটার গড়ের কাছাকাছি মানের বিচ্যুতি বুঝতে |
সারাংশ
Range, Quartile Deviation, এবং Mean Deviation তিনটি গুরুত্বপূর্ণ পরিসংখ্যানিক পরিমাপ যা ডেটার বৈচিত্র্য এবং বিস্তার বোঝাতে ব্যবহৃত হয়। Range ডেটার সর্বোচ্চ এবং সর্বনিম্ন মানের মধ্যে পার্থক্য বোঝায়, Quartile Deviation (QD) ডেটার মধ্যস্থ ৫০% এর মধ্যে পার্থক্য বোঝায়, এবং Mean Deviation (MD) গড় থেকে প্রতিটি ডেটার বিচ্যুতি বোঝাতে ব্যবহৃত হয়। এই পরিসংখ্যানিক পরিমাপগুলো ডেটার বৈচিত্র্য এবং কেন্দ্রীকরণ সম্পর্কে স্পষ্ট ধারণা দেয়।
Read more